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PROCEDE GENERIQUE DE PRODUCTION AUTOMATIQUE 
D'INTERFACES DE RECONNAISSANCE VOCALE POUR UN DOMAIME 
D'APPLICATIOW ET DISPOSITIF DE MISE EN CEUVRE 

La presente invention se rapporte a un procede generique de 
production automatique d'interfaces de reconnaissance vocale pour un 
domaine d'application et a un dispositif de mise en oeuvre de ce procede. 

Des interfaces de reconnaissance vocale sont utilisees, en 
5 particulier dans des systemes d'interaction operateur-systeme, qui sont des 
cas particuliers d'interfaces homme-machine. Une interface de ce type est le 
moyen qui permet a un operateur d'acceder aux fonctions incluses dans un 
systeme ou une machine. Plus precisement, cette interface permet a 
I'operateur d'evaluer I'etat du systeme au travers de modalites de perception 

10 et de modifier cet etat a I'aide de modalites d'action. Une telle interface est 
generalement le fruit d'une reflexion et d'un travail de conception menes en 
amont sur I'interaction operateur-systeme, discipline visant a etudier les 
relations entre un utilisateur et le systeme avec lequel il interagit. 

L'interface d'un systeme, par exemple I'interface homme-machine 

15 d'un systeme informatique, doit etre naturelle, performante, intelligente 
(susceptible de s'adapter en fonction du contexte), fiable, intuitive (c'est-a- 
dire facile a comprendre et a utiliser), autrement dit la plus « transparente » 
possible, afin de permettre a I'utilisateur d'accomplir sa tache sans accroitre 
sa charge de travail par des activites ne relevant pas de son objectif premier. 

20 En faisant appel a des canaux de communication qui nous sont 

familiers, comme la parole et le geste de designation, les interfaces vocales 
sont a la fois plus conviviales et plus performantes. Neanmoins, leur mise en 
place s'avere §tre plus complexe que celle des interfaces traditionnelies, 
graphiques par exemple, car elle necessite I'acquisition de connaissances 

25 multiples, generalement de haut niveau, et la mise en place de traitements 
complexes visant a exploiter ces connaissances pour gerer 
« intelligemment » le dialogue entre I'operateur et le systeme. 

Actuellement, les interfaces vocales sont realisees 
« manuellement », c'est-a-dire qu'a chaque nouvelle interface, il faut 

30 reetudier toutes les fonctions de I'interface sans pouvoir faire appel a a une 
quelconque assistance ( automates par exemple) pour en faciliter la 
realisation. 



2 



La presente invention a pour objet un procede permettant 
d'automatiser la realisation d'interfaces vocales de la fa?on la plus facile 
possible et la plus simple possible, avec un temps et un cout de 
d6veloppement les plus reduits possible. 

-5 La-presente- inv e ntion a ogalem ent-pour-objet un-disposttif-de-mise- 

en oeuvre de ce procede, dispositif qui soit simple k utiliser et peu onereux. 

Le procede conforme a ['invention est caract£rise par le fait qu'on 
saisit un modele conceptuel du domaine ^application de I'interface vocale, 
que Ton produit un ensemble de regies de grammaire generique 

10 representative d'une classe ^applications, que Ton exemplifie les differentes 
regies de grammaire generique dont les contraintes sont satisfaites, que Ton 
produit la grammaire du domaine d'application considere & partir de la 
grammaire generique exemplifiee et du modele conceptuel, et que Ton gere 
Interaction op6rateur/systeme. 

15 Le dispositif de production automatisee d'interfaces vocales 

conforme a invention comporte des moyens de saisie d'un modele 
conceptuel, des moyens de derivation, des moyens de fourniture d'un 
modele generique et des moyens d'ex^cution de la grammaire specifique du 
domaine d'application consider^. 

20 La presente invention sera mieux comprise a la lecture de la 

description detaillee d'un mode de mise en ceuvre, pris k titre d'exemple non 
limitatif et illustre par le dessin annexe, sur lequel : 

- la figure 1 est un bloc-diagramme des principaux moyens mis 
en ceuvre par Pinvention, 

25 - la figure 2 est un bloc-diagramme plus detaille que celui de la 

figure 1 , et 

- la figure 3 est un bloc-diagramme detail^ des moyens 
d'execution des figures 1 et 2. 

Sur la figure 1, on a represents des moyens de saisie 1 
30 permettant de saisir les differentes donnees decrivant le module conceptuel 
du domaine d'application considere et les relations reliant ces donnees. Ces 
donn6es peuvent etre, par exemple, dans le cas de la commande vocale 
utilisee pour le pilotage d'un avion, la terminologie de tous les appareils et de 
toutes les fonctions d'un avion, ainsi que leurs differentes relations mutuelles. 
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Par ailleurs, on constrult et on memorise un ensemble 2 de regies 
de grammaire pour former un modele generique representant une classe 
^applications (pour I'exemple precedemment cite, cette classe serait celle se 
rapportant a la commande des vehicules en general). A partir du modele 
5 conceptuel 1 et du modele generique 2, des moyens de derivation 3 
calculent de fagon automatique i'ensemble des ressources necessaires a la 
production de I'interface vocale desiree, et en deduisent I'ensemble des 
enonces de langage susceptibles d'§tre traites par cette interface dans le 
contexte de I'application traitee. 

10 En outre, le dispositif de I'invention comporte des moyens de 

revision 4 et des moyens d'explication 5. Les moyens de revision 4 sont 
supervises par I'operateur du dispositif ou par son concepteur. lis ont pour 
rdle de reviser les donnees saisies par I'operateur a I'aide des moyens 1 , 
dans le but de corriger des termes contraires a la semantique de I'application 

15 conside>6e et/ou d'ajouter de nouveaux termes pour enrichir la grammaire du "t 
domaine d'application. Les moyens d'explication 5 permettent de faciliter la $ 
revision des donnees saisies par I'operateur en exposant les regies qui ont * 
ete appliquees lors de I'elaboration de la grammaire specifique du domaine 
d'application. 

20 Les moyens d'execution 6 sont charges de produire i 

automatiquement I'interface vocale du domaine d'application considere. Le ' ! 
procede de production de cette interface repose sur la distinction entre les 
ressources qui dependent de I'application et sont des ressources specifiques 
(c'est-a-dire I'ensemble des concepts constituant le modele conceptuel saisi 

25 par les moyens 1 et I'ensemble des termes constituant le lexique), et les 
ressources qui ne dependent pas de cette application (ressources 
geneYiques), a savoir les regies syntaxiques de la grammaire et I'ensemble 
du lexique de base, qui sont propres a la langue utilisee. 

Pour mettre en ceuvre ce procede, le concepteur de I'interface 

30 vocale doit decrire a I'aide des moyens de saisie 1 les ressources 
specifiques a I'application consideree, c'est-a-dire le modele conceptuel et le 
lexique de cette application. II s'agit pour lui de d<§finir les concepts de 
I'application qu'il souhaite pouvoir etre regis par la voix, puis de verbaliser 
ces concepts. Ce travail de saisie peut etre facilite par I'utilisation d'un 



modele formei de Papplication envisages, sous reserve que ce modele existe 
et soit disponible. 

Lorsque les ressources specifiques a I'application sont ainsi 
acquises, les moyens de derivation 3, qui fonctionnent de maniere 

-5 --entferement^toma^ ces r essuuices specifiques el 

des ressources generiques fournies par les moyens 2 le module linguistique 
de Tinterface vocale pour ladite application. Ce modele linguistique se 
compose de la grammaire et du lexique du sous-langage d6die a cette 
interface. Les moyens de derivation 3 permettent 6galement de calculer 

10 Pensemble des enonces de ce sous-langage (c'est-&-dire sa phraseologie), 
ainsi que Pensemble des connaissances relatives a I'application et 
necessaires a la gestion du dialogue operateur-systeme. 

Les moyens de revision 4 permettent ensuite a Poperateur de 
visualiser tout ou partie de la phraseologie correspondant a son travail de 

15 saisie, afin de pouvoir affiner cette phraseologie par ajout, suppression ou 
modification. Afin d'aider Poperateur dans cette tache, les moyens 5 de 
production ^explications permettent de reperer automatiquement quelies 
donnees conceptuelles et lexicales saisies par I'operateur sont a Porigine 
d'une caracteristique donnee d'un enonce ou d'un ensemble d'enonces du 

20 sous-langage produit. 

Enfin, les moyens d'execution 6 constituent Penvironnement 
auquel il est fait appel lors de Putilisation de Pinterface vocale produite, afin 
de valider cette interface. A cet effet, les moyens d'execution exploitent 
Pensemble des donnees fournies par les moyens de saisie 1 et les moyens 

25 de derivation 3. 

On a represents en figure 2 un exemple de realisation du dispositif 
de mise en oeuvre du procede de Pinvention. L'operateur dispose d'une 
interface de saisie 7, telle qu'une interface graphique, pour saisir le modele 
conceptuel 8 de Papplication considered II dispose par ailleurs d'une base de 

30 donnees 9 comprenant les entites ou concepts de Papplication, et d'un 
lexique 10 de cette application. Ainsi, le modele conceptuel est forme des 
entites de Papplication et de leurs associations mutuelles, c'est-a-dire des 
relations predicatives liant entre eux les concepts de I'application. La saisie 
du modele conceptuel est congue comme un processus iteratif et assiste 



faisant appel a deux sources de connaissance principales, qui sont la 
grammaire genSrique 1 1 et le lexique de base 12. 

L'une des facons de realiser les moyens de derivation 3 consiste a 
etendre une grammaire syntaxique et semantique de maniere a autoriser la 
5 prise en compte de contraintes conceptuelles. il est ainsi possible de definir 
dans ce formalisme de haut niveau une grammaire generique dont 
I'adaptation au domaine d'application s'effectue de fagon automatique au 
travers des donnees saisies par I'operateur. Les moyens de derivation 
permettent ainsi de calculer la grammaire syntaxico-semantique et le lexique 
10 propres au domaine d'application. Ainsi, comme schematise en figure 2, a 
partir du modele conceptuel 8 saisi par I'operateur, le dispositif deduit' le 
modele iinguistique qu'il transmet aux moyens de derivation 13. II faut noter 
ici que le modele conceptuel est utilise non seulement pour calculer le 
modele Iinguistique et les sous-modeles qui lui sont lies (modele Iinguistique 
15 pour ia reconnaissance , modele Iinguistique pour I'anafyse et modele 
Iinguistique pour la generation, mais sert egalement a la gestion du dialogue 
operateur- systeme pour tout ce qui releve de la reference aux concepts et 
aux objets de I'application. 

Les moyens de revision- explication 14, pour leur fonction de 
20 revision, sont accessibles via Nnterface graphique 7 de saisie du modele 
conceptuel de I'application. lis font appel a un generateur de grammaire 15 
qui calcule la grammaire correspondant au modele saisi et offre des 
mecanismes pour afficher tout ou partie des enonces correspondants. A cet 
effet, le generateur de grammaire 15 comprend une grammaire 16 
25 syntaxique et semantique d'analyse d'enonces, une grammaire 17 de 
generation d'enonces et une grammaire 18 de reconnaissance vocale. 

Les moyens de revision-explication 14, pour leur fonction 
d'explication, se basent sur une analyse formelle du calcul effectue par les 
moyens de derivation 13 pour identifier les donnees qui sont a I'origine des 
30 caracteristiques de ces enonces. Ces moyens permettent a I'operateur de 
concevoir de fagon iterative son modele tout en s'assurant que les enonces 
qui seront produits repondent bien a ses attentes. . 

On a detaille en figure 3 un exemple de realisation des moyens 
d'execution 6 de I'interface vocale. Ces moyens component : 
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- un dispositif 19 de reconnaissance de parole, qui utilise la 
grammaire 18 derivee du modele linguistique de maniere 
automatique ; 

- un analyseur d'enonces 20 qui utilise le modele linguistique 
fottmHaaHes-moyens de-depivaton 

et semantiquement I'exactitude des enonces ; 

- un processeur de dialogue 21 qui utilise le modele conceptuel 
saisi par I'operateur, ainsi que la base de donnees 9 des entites 
linguistiques de ('application, saisie par I'operateur ou construite 
automatiquement par I'application 22 ; 

- un generateur d'enonces 23, qui utilise la grammaire de 
generation d'enonces 17 deYiv^e du modele linguistique de 
maniere automatique ; 

- un dispositif 24 de synthese de parole. 

L'ensemble des elements 19 a 21 et 23, 24 d'execution de 
I'interface vocale est gere dans le cas present par un systeme 25 de type 
multi-agents. 

On va maintenant expliquer la mise en oauvre des moyens de 
saisie, des moyens de revision et des moyens d'explication a I'aide d'un 
exemple tres simple. 

A) Moyens de saisie 

Si Ton souhaite rendre accessibles a la voix les concepts de 
chaTne de television (CHANNEL), programme televise (PROGRAMME), film 
(MOVIE), dessin anime (CARTOON), ainsi que le fait qu'une chatne de 
television diffuse (PLAY) des programmes televises, il faut d'abord utiliser les 
moyens de saisie pour decrire le lexique, se rapportant a des concepts, que 
Ton souhaite prendre en compte. 

Dans un premier temps, les moyens de saisie permettent d'aider 
le concepteur de I'interface vocale lors de la constitution du lexique. Pour 
cela, des mecanismes sont mis en oeuvre afin de proposer, pour un terme 
donne (par exemple « movie » pour la version anglaise du lexique et « film » 
pour la version francaise) l'ensemble des formes flechies correspondant a ce 
terme (singulier et pluriel d'un nom commun ou conjugaisons d'un verbe, par 
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exemple). Le concepteur du iexique n'a done qu'k selectionner parmi toutes 
ces formes, celles qu'il souhaite retrouver dans interface vocale. 

Les concepts qui doivent etre accessibles k la voix sont ensuite 
cr66s via ces memes moyens de saisie. II s'agit dans le cas present de creer 
5 des entites CHANNEL, PROGRAMME, MOVIE et CARTOON et une relation 
PLAY. Ces concepts sont reltes k un ensemble de termes du Iexique. Ainsi, 
le concept MOVIE sera relie aux termes « movie », « movies », « film » et 
« films ». Ces liens permettront de creer un certain nombre de clauses 
utilisees par les moyens de derivation : 
10 © entity ([CARTOON, [cartoon]]) 

o entity ([MOVIE, [movie]]) 

© entity ([PROGRAMME, [programme]]) 

® entity ([CHANNEL, [channel 5, enn]]) 

* ... etc 

15 Dans le cas de la relation PLAY, il faut expliciter les acteurs de 

cette relation : la chaine teldvisee et le programme. Ceci donne lieu a un 
autre type de clauses k destination des moyens de derivation : 

o functionaLstructure ([PLAY, Subject (CHANNEL), DirectObject 
(PROGRAMME), [play]]). 

20 Les moyens de saisie permettent ensuite d'expliciter un certain 

nombre de relations supplementaires entre ces concepts. Par exemple, un 
film est un type de programme \6\6v\s&. Ces relations auront comme 
consequence de creer d'autres clauses utilisees par les moyens de 
derivation : 

25 o js_a (MOVIE, PROGRAMME) 

© ... etc. 

La mise en place de ces moyens de saisie permet avant tout de 
faciliter la saisie des ressources specif iques necessaires k la mise en oeuvre 
de Tinterface vocale. En effet, cette saisie s'effectue en grande partie gr&ce & 

30 la selection de certains criferes parmi un ensemble de criteres proposes via 
une interface graphique. Le fichier de ressources (clauses) necessaire aux 
moyens de derivation est g§n£re automatiquement a partir de cette 
representation graphique de Tensemble des criteres choisis. Ceci permet au 
concepteur de Tinterface vocale de ne pas faire d'erreur de syntaxe dans le 

35 fichier de ressources, ni d'oubli. 



B) ftfloyens de revision 



Les moyens de revision permetlent au concepteur de I'interface 



Une premiere 6tape du processus de revision consiste a visualiser 



tout ou partie de la phraseologie correspondant au modele conceptuel. 



Dans le present exemple, on pourrait visualiser les phrases 



1) Un film 

2) Un dessin animg 

3) Un film diffuse Channels 

4) ... etc 

La phrase « Un film diffuse Channel 5 » est incorrecte. Les 



moyens d'explication permettent de voir que cette erreur vtent du fait que la 
relation PLAY a et6 mal definie : 

© functionaLstructure ([PLAY, Subject (PROGRAMME), 
DirectObject (CHANNEL), [play]]). 

PROGRAMME joue le rdle du sujet 
Au lieu de : 

o functionaLstructure (PLAY, Subject (CHANNEL), DirectObject 

(PROGRAMME), [play]]). 
CHANNEL joue le rdle de sujet 

Les moyens de revision permettent au concepteur de I'interface 
vocale de visualiser cette erreur, et de modifier le modele conceptuel de 
fagon a la corriger. 

C) Moyens d'explication 



Les moyens d'explication ont pour fonction d'identifier et de 



decrire ie sous-ensemble ou la caracteristique du modele conceptuel dont la 
compilation produit la sous-grammaire correspondant & un 6nonce 
particulier, a une expression langagiere - un morceau d'£nonce - 




l§te~7XRTCuptuel qui ^r§te cfge via les 



moyens de saisie. 



suivantes : 
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particuliere, ou a une propriete langagiere - une caractenstique d'expression 
- particuliere. 

Ainsi, grace aux moyens d'explication, I'utiiisateur a la possibilite, 
en s<§lectionnant un enonce, une expression ou une propriety engendree par 

5 la grammaire, de retrouver et de comprendre le sous-ensemble ou la 
caracteristique du modele conceptuel qui en est I'origine. 

Des lors, il peut modifier le modele conceptuel pour modifier 
I'enoncS, I'expression ou la propriete engendree et, en r&terant le processus, 
affiner le modele conceptuel afin d'obtenir la grammaire du langage souhaite. 

o A titre d'exemple, la possibilite d'utiliser le pluriel dans la relation 

entre I'entite unte et I'entite mission dans les quatre expressions ci-dessous 
est fonction de la cardinality de cette relation. 

1 . « la mission de Punite » 

2. « les missions de I'unite » 
5 3. « la mission des unites » 

4. « les missions des unites » 

La relation en question est decrite par la regie conceptuelle 

suivante : 

entite (unite, relation (mission, X, Y)) 

Si X = 1 et Y = 1, seule I'expression 1. est autorisee par la 
grammaire. Si X = 1 et Y = n, seules les expressions 1 . et 2. sont autorisees 
par la grammaire. Si X = n et Y = 1, seules les expressions 1. et 3. sont 
autorisees par la grammaire. Enfin, si X = n et Y = n, toutes les expressions 
sont autorisees par la grammaire (n > 2). 

Dans cet exemple, les moyens d'explication doivent permettre a 
I'utiiisateur d'identifier qu'il faut modifier la cardinality de la regie conceptuelle 
pour obtenir la grammaire correspondant aux expressions plurielles qu'il 
souhaite inclure dans son langage. 

Un mode de realisation des moyens d'explication consiste a 
construire un precede d'analyse en arriere (« baclttracking » en anglais) sur 
le precede de compilation de la grammaire, qui va permettre de partir du 
resultat pour retrouver les regies conceptuelles qui aboutissent a ce resultat 
et par la suite de les decrire a I'utiiisateur. 
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REVENDICATIOSSSS 

1. Procede generique de production automatique d'interfaces de 
reconnaissance vocale pour un domaine d'application, caracterise par le fait 

qu'on saisit (1, 7) un m odele c onc eptuel du dom aine d'application de 

I'interface vocale, que Ton produit un ensemble de regies de grammaire 
5 generique (11) representative d'une classe duplications, que Ton exemplifie 
les differentes regies de grammaire generique dont les contraintes sont 
satisfaites, que Ton produit la grammaire du domaine d'application considere 
(6) a partir de la grammaire generique exemplifiee et du modele conceptuel 
(13) et que Ton gere I'interaction operateur-systeme. 

10 2. Procede selon la revendication 1 , caracterise par le fait que Ton 

revise les donnees saisies et que Ton corrige les termes contraires a la 
semantique de I'application consideree. 

3. Procede selon la revendication 1 ou 2, caracterise par le fait 
que I'on revise (4) les donnees saisies et que Ton ajoute de nouveaux termes 

1 5 pour enrichir la grammaire du domaine d'application. 

4. Procede selon Tune des revendications precedentes, 
caracterise par le fait que Ton produit des explications (5) exposant les regies 
qui ont ete appliquees lors de I'elaboration de la grammaire specifique du 
domaine d'application. 

20 5. Dispositif de production automatisee d'interfaces de 

reconnaissance vocale pour un domaine d'application, caracterise par le fait 
qu'il comporte des moyens de saisie (1, 7) d'un modele conceptuel, des 
moyens de derivation (3, 13), des moyens de fourniture d'un modele 
generique (2, 11) et des moyens d'execution de la grammaire specifique du 

25 domaine d'application considere (6, 15). 

6. Dispositif selon la revendication 5, caracterise par le fait qu'il 
comporte en outre des moyens de revision (4, 14). 

7. Dispositif selon la revendication 5 ou 6, caracterise par le fait 
qu'il comporte en outre des moyens d'explication (5, 14). 

30 
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